Bionic Reading
単語の最初の数文字だけを太くすることで文章を素早く認識・理解できるようにした仕組み
https://gyazo.com/040c309d8d1042af414618ecad2c493b
解説note
これはスゴいはるひ.icon
おもしろいcFQ2f7LRuLYP.iconyosider.icon
読みやすくなってような気もするけど他の文章でも試してみたいyosider.icon
APIがあった
日本語でできるかな?はるひ.icon
読みにくい文書なんかないかなcFQ2f7LRuLYP.icon
この数篇の文章は何人かの人々を論じたものである。いや、それらの人々に対する僕の好悪を示したものである。
この数篇の文章の中に千古の鉄案を求めるのは勿論甚だ危険である。僕は少しも僕の批判の公平を誇らうとは思つてゐない。実際又公平なるものは生憎僕には恵まれてゐない、――と云ふよりも寧ろ恵まれることを潔しとしない美徳である。
適当にやってみたけどなんかダメだなcFQ2f7LRuLYP.icon
英語のように七文字からなる語とかがない
Bionic Readingで与えられている手がかりを考えてみるmtane0412.icon
Bionic
最初の3文字がBio-から始まる単語
単語の長さと形の形態的情報
ここで一旦脳に処理が投げられている
すごいインクリメンタルサーチっぽい
単語の読みも非同期的にガンガンやっている感じ
Reading is
大文字Read-から始まる、この長さと形態の単語
isはisだろう
BionicをBionicと予測したが続く語と統語的に辻褄が合っている
母語である日本語の読みで我々はこういうのをやっているはずmtane0412.icon
ひらがなとカタカナとスペース(単語の長さ・モーラの数)で単語の推測を行っている例
code:ケンブリッジ大学のコピペ
わしたは げんき です。 この ぶんょしう は いりぎす の ケブンッリジ だがいく の けゅきんう の けっか にんんげ は もじ を にしんき する とき その さしいょ と さいご の もさじえ あいてっれば じばんゅん は めくちちゃゃ でも ちんゃと よめる という けゅきんう に もづいとて わざと もじの じんばゅん を いかれえて あまりす。
どでうす? ちんゃと よゃちめう でしょ?
ちんゃと よためら はのんう よしろく
日本語になぜスペースがないか議論が日本語学習者(とプログラマw)からよく挙がるが、漢字とひらがな・カタカナがある
これらを手がかりに読んでいるので英語のBionic Readingをそのまま適用してもあまり効果がない
漢字が自ずとBionic Readingの効果をもっていた!?yosider.icon
でも、日本語の漢字と英語のスペースが同じ効果をもつとしたら、英語のBionic Readingに対応する工夫が別に日本語にもあるはずか…?
日本語をスペースで区切って、かつ漢字を使って表記すれば、漢字が英語のBionic Readingに対応する?
なるほどcFQ2f7LRuLYP.icon
知り合いのニュージーランド人(英日バイリンガル)が「日本語みたいに読める!」って言っていたmtane0412.icon
ほえ~~。なるほどはるひ.icon
Scrapbox上で選択した文章をBionicに変換するPopupMenu作れそうyosider.icon 否定的研究
概要
バイオニックリーディング(単語の前半を太字にする読書法)の効果を初めて科学的に検証
結果として、読書速度の向上は確認できず、主張されている効果に疑問を投げかけた
大規模言語モデルを用いた新しいアプローチの可能性を提案
先行研究と比べてどこがすごい?
これまでバイオニックリーディングの科学的検証は行われていなかった
理論的な観点から、効果があるとする主張と、逆効果となる可能性の両方を考察
32人の被験者で1600のサンプルを分析という十分な規模での実験を実施
技術や手法のキモはどこ?
単語の前半を太字にすることで最適な視点位置への誘導を図る手法
理論的根拠として、左半分の情報が単語認識に重要という知見を活用
ただし、不必要な注視を引き起こす可能性も指摘
どうやって有効だと検証した?
32人のオランダ語ネイティブ大学生を対象に実験
日本語(のような英語とはかなり離れた言語)のネイティブだとどうか?yosider.icon
100個の文章を通常版とバイオニック版で読ませる
読解時間を測定し、理解度確認のための質問も実施
熟練度による違いや、慣れの効果も分析
議論はある?
ディスレクシアの人々への効果は未検証
サンプルサイズをさらに大きくすれば小さな効果が検出される可能性
大学生のみを対象としており、一般化可能性に制限
単語の分割方法が言語学的な単位(形態素や音節)を考慮していない問題
次に読むべき論文は?
Brysbaert & Stevens (2018) - 統計的検定力分析の方法論について
De Simone et al. (2023) - 読書における音節と形態素の役割
Hasenäcker & Schroeder (2017) - 単語認識における言語学的単位の重要性
大規模言語モデルを用いたテキスト分析に関する論文(Touvron et al., 2023)
論文で提案されている大規模言語モデル(LLM)を活用した新しいアプローチを説明します:
現在のバイオニックリーディングの問題点:
単純に単語の前半を太字にするため、実際には重要でない部分も強調される
言語的な意味や文脈を考慮していない
不必要な注視を引き起こす可能性がある
LLMを活用した新提案:
LLMを使って、テキスト内の「情報量が多い」重要な位置を特定
LLMでなくても冠詞・be動詞・前置詞とかを除くだけでも結構改善するかもyosider.icon
エントロピー(情報の不確実性)が最も削減される箇所を計算
その位置の文字だけを選択的に太字化
これにより、次の単語を予測するのに本当に重要な手がかりだけを強調できる
期待される利点:
意味的に重要な箇所だけが強調されるため、無駄な視線の移動を防げる
文脈を考慮した強調が可能になる
読者の予測処理をより効果的に支援できる
このアプローチは単純な機械的強調ではなく、文脈や意味を考慮した知的な強調を目指すものといえます。
基素.icon
理論的な観点から、効果があるとする主張と、逆効果となる可能性の両方を考察
何
claude.icon
効果がある可能性(良い面):
左から右に読む言語では、単語の中心よりやや左を注視すると認識が最も効率的
単語の左半分は右半分より情報量が豊富(例:'ta'は'table'を示唆するが'le'はそれほどでない)
太字化により最適な注視位置への誘導が期待できる
脳の言語処理における半球非対称性とも整合的
逆効果の可能性(悪い面):
不必要な注視の誘発
通常、短い単語や予測可能な単語(全単語の約35%)は飛ばして読める
へ〜基素.icon
しかし太字化により目が引きつけられ、スキップできない可能性
結果として読書速度が低下する恐れ
細かい表現の違いや、表記揺れが気になる
単語内の視覚的一貫性の崩壊
太字と非太字の混在が単語認識を妨げる可能性
特に音節や形態素の境界を考慮せずに機械的に分割することの問題
言語処理における重要な単位(形態素や音節)の認識を妨害する可能性
これらの理論的予測が、実験で効果が見られなかった結果の説明となりうると論文では示唆しています。
じゃあ読みやすいと感じたのは気のせいだったのだろうか?yosider.icon